ارتقای کیفیت دسته‌بندی متون با استفاده از کمیته‌ دسته‌بند دو سطحی

نویسندگان

  • Ali Akbar Sadri
  • Sa'eed Jalili
چکیده مقاله:

Nowadays, the automated text classification has witnessed special importance due to the increasing availability of documents in digital form and ensuing need to organize them. Although this problem is in the Information Retrieval (IR) field, the dominant approach is based on machine learning techniques. Approaches based on classifier committees have shown a better performance than the others. In this research, in addition to study text classification techniques and classification committees, two ideas in this field are proposed. The first idea, is proposed based on Bagging committees. According to this idea, first, a training set by one of clustering techniques automatically is divided into several clusters based on class similarity (or dissimilarity). So for documents of every cluster, a classifier is trained and put in the committee as a member. In this approach the members of committee are created by the same technique. In our experiments for this idea, Naïve Bayesian, Rocchio and SVM learning techniques are used. In the second idea, the creation of two layered committee is discussed. Based on this idea, one committee can be created that its members are itself a committee. Members of subcommittees are creating based on the first idea. This idea is based on the fact that if Naïve Bayesian committee acts better than Naïve Bayesian classifier and so, a committee out of these committees will improve the performance of classification. Evaluation of the first idea showed that the improvement in performance based on precision and recall in Naïve Bayesian committee is exceeded the other committees (respectively 12 and 5.1 percent). Evaluation of the second idea showed that the improvement in performance in the second type of committee (based on the second idea) is more than that in the first type of committee (based on the first idea). Most improvement of performance in the second type of committee is referred to the Rocchio’s committee (based on precision and recall 3.8 and 18.8 percent, respectively).

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارتقای کیفیت دسته بندی متون با استفاده از کمیته دسته بند دو سطحی

امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته بندی خودکار اهمیت وی‍‍ژه ای یافته است. روش های معمول در این زمینه، روش های یادگیری ماشین هستند. روش های بر اساس کمیته کارایی بهتری نسبت به سایر روش ها از خود نشان داده اند. در این مقاله، دو ایده در زمینه کمیته های دسته بند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه ای از مجموعه سندها...

متن کامل

تشخیص و دستهبندی ترک‌‌های روسازی با استفاده از شبکه‌های پیچشی عمیق

ارزیابی اطلاعات روسازی یکی از مهم‌ترین گام‌های پیاده‌سازی سامانه مدیریت روسازی است و سالانه تلاش‌های گسترده‌ای به منظور افزایش کارایی این سامانه با استفاده از فناوری‌های جدید انجام شده است. در سال‌های اخیر تمرکز سازمان‌ها بر توسعه سامانه‌های خودکار به منظور برداشت و ارزیابی بهتر اطلاعات روسازی بوده و تحقیقات گسترده‌ای در این زمینه انجام شده است. دانش داده‌کاوی و یادگیری ماشین با هدف بهره‌گیری ا...

متن کامل

ارتقای کیفیت نفت زیستی با استفاده از راکتور پلاسما

افزایش تقاضا برای سوخت های فسیلی و اتمام قریب الوقوع این منابع و به دنبال آن پیش بینی افزایش قیمت جهانی انرژی به دلیل محدودیت منابع فسیلی، جهان را با بحران انرژی روبه رو ساخته است. از این رو اهمیت و ضرورت تغییر سیستم فعلی تولید و مصرف انرژی و جایگزینی آن با منابع انرژی های تجدیدپذیر برای پاسخگویی به نیاز انرژی جهانی در آینده نمایان می شود. زیست توده بعنوان یکی از منابع انبوه انرژی های تجدیدپذیر...

ارتقای کیفیت آموزش در سامانه‌های آموزش الکترونیکی با استفاده از داده‌کاوی آموزشی

آموزش الکترونیکی، عبارت است از انجام فرایند آموزشی بر روی بستر ارتباطات الکترونیکی همچنین بهره‌گیری از فناوری شبکه برای طراحی، ارائه و توسعه آموزش می­باشد که فراگیران، کارشناسان و تهیه‌کنندگان مطالب را در بر می­گیرد. در این میان حجم وسیعی از اطلاعات مانند نحوه تعامل کاربر با سامانه­های مدیریتی آموزش، دروس انتخابی دانشجو و نمرات دانشجویان ذخیره می­گردد. این داده­ها حاوی اطلاعات با ارزشی برای مطا...

متن کامل

ارتقای کیفیت نفت خام فوق سنگین با استفاده از سدیم مولیبدات تجاری

مطابق آمار‌های مراجع بین المللی، به‌تقریب نیمی از ذخایر نفتی جهان به پایان رسیده است که لزوم استفاده هر چه بهینه‌تر از ذخایر فعلی، به‌ویژه تبدیل باقی‌مانده‌‌های سنگین نفتی و نفت خام فوق سنگین به ترکیب‌های سبک‌تر را نشان می‌دهد. این پژوهش به بررسی استفاده مستقیم از سدیم مولیبدات تجاری به عنوان کاتالیستی در دسترس و ارزان برای ارتقای کیفیت نفت خام فوق سنگین و باقی‌مانده‌‌های سنگین نفتی می‌پردازد. ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 41  شماره 5

صفحات  597- 614

تاریخ انتشار 2013-05-18

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023